Análisis de imagenes de redes sociales de agencias de seguridad mexicanas

Qué queremos lograr con este estudio?

TBD

Qué se está analizando?

A continuación el proceso paso a paso

Descargamos 1348 imagenes de la página de Dacebook de la Secretaría de Marina de México junto con sus metadatos

La descarga fue manual siguiendo los URLs de la siguiente tabla:

Analizamos cada una con los algoritmos de clasificación de escena de Amazon Rekognition

Obtenemos de ese servicio una lista de posibles temáticas detectadas junto con el % de confianza

Definimos un diccionario de palabras relacionadas a la milicia para eliminar el resto de las temáticas no militares detectadas

Diccionario:

##  [1] "Boat"               "Vehicle"            "Transportation"    
##  [4] "Watercraft"         "Vessel"             "Military"          
##  [7] "Navy"               "Cruiser"            "Ship"              
## [10] "Destroyer"          "Battleship"         "Coast Guard"       
## [13] "Helicopter"         "Aircraft"           "Airplane"          
## [16] "Bomber"             "Warplane"           "Jet"               
## [19] "Sailor Suit"        "Officer"            "Military Uniform"  
## [22] "Operating Theatre"  "Swat Team"          "Word"              
## [25] "Tower"              "Pier"               "Dock"              
## [28] "Port"               "Helmet"             "Lifejacket"        
## [31] "Army"               "Armored"            "Cockpit"           
## [34] "Crash Helmet"       "Hardhat"            "Weapon"            
## [37] "Weaponry"           "Marching"           "Soldier"           
## [40] "Security"           "Sailboat"           "Airfield"          
## [43] "Landing"            "Badge"              "Emblem"            
## [46] "Barge"              "Gun"                "Troop"             
## [49] "Flare"              "Life Buoy"          "Freighter"         
## [52] "Tanker"             "Rotor"              "Yacht"             
## [55] "Propeller"          "Biplane"            "Tank"              
## [58] "Captain"            "Dynamite"           "Bomb"              
## [61] "Cannon"             "Guard"              "Parachute"         
## [64] "Sniper"             "Amphibious Vehicle" "Shooting Range"

Filtrado de temáticas con diccionario

Definimos un umbral de confianza para deducir ocurrencia de temas militares

Unimos estos datos de ocurrencia de temáticas militares con metadatos de reacciones sociales

Preguntas de investigación

Cuántas imagenes quedaron fuera una vez aplicados los filtros de confianza >= 65% y el filtro de diccionario de etiquetas militares?

## [1] "71.07 %"

Qué etiquetas estaban sobrerepresentadas en las imgs que quedaron fuera? Qué etiquetas estaban subrepresentadas?

Para este resultado, presentaremos las etiquetas detectadas que NO pertenecen al diccionario de palabras relacionadas a la milicia, y además eliminaremos aquellas categorías que solo estén representadas en 10 fotografias por considerarlas de poca densidad y por tanto de poca relevancia:

Adicionalmente, vamos a eliminar las siguientes etiquetas por ser demasisado generales y poco relacionadas con el objetivo de investigación:

##   [1] "Human"             "Person"            "Apparel"          
##   [4] "Clothing"          "Water"             "Nature"           
##   [7] "Airport"           "Vest"              "Sky"              
##  [10] "Pants"             "Harbor"            "Hardware"         
##  [13] "Computer Hardware" "Computer Keyboard" "Sunglasses"       
##  [16] "Art"               "Logo"              "Trademark"        
##  [19] "Computer"          "Field"             "Land"             
##  [22] "Screen"            "Display"           "Lawn"             
##  [25] "Phone"             "Countryside"       "Weather"          
##  [28] "Long Sleeve"       "Train"             "Sitting"          
##  [31] "Book"              "Marina"            "Gliding"          
##  [34] "Banister"          "Soil"              "Number"           
##  [37] "Document"          "Handrail"          "Pedestrian"       
##  [40] "Airliner"          "Railing"           "Plot"             
##  [43] "Cell Phone"        "Mobile Phone"      "Arecaceae"        
##  [46] "Palm Tree"         "Jacket"            "Tie"              
##  [49] "Graphics"          "Room"              "Sleeve"           
##  [52] "Laptop"            "Skateboard"        "Silhouette"       
##  [55] "Collage"           "Rowboat"           "Spoke"            
##  [58] "Clock Tower"       "Diver"             "Diving"           
##  [61] "Desk"              "Finger"            "Downtown"         
##  [64] "Astronaut"         "Path"              "Paintball"        
##  [67] "Housing"           "Suit"              "Label"            
##  [70] "LCD Screen"        "Van"               "Denim"            
##  [73] "Jeans"             "Sun"               "Table"            
##  [76] "Landscape"         "Scenery"           "Overcoat"         
##  [79] "Sunrise"           "Keyboard"          "Portrait"         
##  [82] "Monitor"           "Road"              "Indoors"          
##  [85] "Dawn"              "Dusk"              "Red Sky"          
##  [88] "Sunset"            "Cap"               "Shoreline"        
##  [91] "Coast"             "Pc"                "Photo"            
##  [94] "Photography"       "Sunlight"          "Ferry"            
##  [97] "Tire"              "Light"             "Asphalt"          
## [100] "Tarmac"            "Mammal"            "People"           
## [103] "Text"              "Truck"             "Face"             
## [106] "Team"              "Metropolis"        "Vegetation"       
## [109] "Chair"             "Fireman"           "Police"           
## [112] "Building"          "Animal"            "Footwear"         
## [115] "Shoe"              "Paper"             "Machine"          
## [118] "Hat"               "Plant"             "Waterfront"       
## [121] "Bird"              "Electronics"       "Sport"            
## [124] "Sports"            "Ocean"             "Sea"              
## [127] "Wheel"             "Accessories"       "Accessory"        
## [130] "Urban"             "Adventure"         "Grass"            
## [133] "Coat"              "Police Dog"        "Furniture"        
## [136] "Beach"             "Architecture"      "Wood"             
## [139] "Shorts"            "Automobile"        "Car"              
## [142] "Flying"            "Costume"           "Wood"             
## [145] "Baseball Cap"

Excluyendo estas etiquetas, nos queda la siguiente representación:

Dato curioso

Hemos eliminado la etiqueta Paintball porque las imagenes que tienen asignada esta etiqueta son de este tipo:

Lo cual definitivamente no es correcto.

Qué etiquetas están relacionadas con una percepción positiva de la SEMAR ante la sociedad y con qué frecuencia aparecen?

Para esta pregunta definiremos las siguientes categorías: 1. acercamiento con la sociedad civil 2. acciones de rescate y manejo de desastres 3. asistencia en campañas de salud 4. Proyección de imagen positiva 5. Proyección de imagen patriótica 6. Inclusión y género

Luego tomaremos armaremos 3 diccionarios con las etiquetas que creemos que están relacionadas con cada una, sin repetir etiquetas en diferentes categorías

Posteriormente agrupamos este diccionario en términos similares para formar categorías:

  • tipos de publicación VS tipos de reacción
  • línea de tiempo de actos específicos - fechas?

Líneas de investigación que requieren de mayor elaboración

  1. Capacidad de armamento: esta línea requiere de un modelo de computer vision específicamente entrenado para identificar armamento y ejecutarlo en el subconjunto de imagenes cuya etiqueta si tiene relación con la milicia.
  • Análisis de sentimiento de comentarios hechos a fotografías: de momento no tenemos disponibles dichos comentarios.